查看原文
其他

继云计算巨头失火事件后,微软决定送数据中心去“泡澡”!

IT服务圈儿 2022-09-11

The following article is from CSDN Author 郑丽媛


整理丨郑丽媛

本文经授权转自公众号CSDN(ID:CSDNnews)


上个月,欧洲云服务巨头 OVH 数据中心起火,导致大量网站瘫痪,甚至部分客户数据完全丢失且无法恢复。

彼时,有关数据中心保护的话题一度引起热议,其中“散热”更一直是数据中心面临的一大难题,国内外大厂也各出奇招:阿里利用湖水制冷技术在千岛湖设立数据中心;Facebook 将数据中心建在接近北极圈的瑞典,用风扇引入极地冷风;腾讯云贵安七星数据中心也设立在贵州阴凉的山洞之中......

而此前直接把数据中心放进大海的微软,更是得到了意外的收获:水下数据中心的服务器故障率比传统数据中心更低。

或许是以此为灵感,微软最近又开始捣鼓新的散热方式了:将服务器侵入“液体浴池”。

(图片来自微软)



1


空气冷却还不够


近年来,大部分数据中心都在采用空气冷却的方法使其降温,即利用外部空气,通过蒸发将温度降至 35 摄氏度以下。

然而随着芯片的发展,更多的晶体管封装到相同尺寸的芯片上,计算机处理器的运行速度几乎每两年翻一番,对人工智能等高性能应用的更快计算机处理器的需求也正在加速增长。

因此,为了满足性能需求,计算机行业已经转向可以处理更多电能的芯片架构。例如,中央处理单元(CPU)已从每个芯片 150 瓦增加到 300 瓦以上;图形处理单元(GPU)已增加到每个芯片 700 瓦以上。

通过处理器输送的功率越高,芯片的散热越多,而为了避免芯片过热产生故障,冷却要求也随之提高。

对此,位于雷德蒙德的微软数据中心高级开发小组的工程师兼副总裁 Christian Belady 表示:“空气冷却还不够。这就是促使我们采用浸入式冷却的原因,我们可以在其中直接蒸发掉芯片表面的热量。”他指出,液体的传热效率比空气高几个数量级。

由此,微软开始采用液体冷却方式:将服务器浸泡在液体中。




2


两相浸入式冷却:即“浴缸”


把计算机配件浸入液体中,乍一听似是天方夜谭,但对早已将数据中心沉入大海的微软而言不过是家常便饭了。

探索水下数据中心潜力的 Natick 项目使微软取得了不小的收获,项目负责人 Ben Cutler 发现:“数据中心在水中的故障率是在陆地上的八分之一。”通过初步分析,出现这种结果的主要原因是处于水下的数据中心没有湿度和氧气的腐蚀干扰。

因此,微软目前选择直接将服务器的硬件浸泡在液体中,微软数据中心高级开发团队的首席硬件工程师 Husam Alissa 解释道:“我们将海引入了服务器,而不是将数据中心置于海底。”

微软称这种散热方法为两相浸入式冷却,浸泡的液体用的是 3M 公司特别设计的不导电液体。工作原理是:这种液体以氟碳为基础,当它直接接触到服务器组件时,吸收热量易达到较低的沸点——50 摄氏度,蒸汽遇到冷凝器就自动液化为液体落回服务器中,从而形成一个闭环冷却系统,并且由于不需要额外的能量让液体流动,冷凝器也不需要冷却器,大幅降低了成本。

(图片来自微软)

Belady 在接受 The Verge 的采访时,将其形象形容为:“这实际上是一个浴缸。”他比喻道:“架子将躺在浴缸内,你所看到的沸腾现象,就像在锅子里沸腾一样。只不过,你锅中的沸腾温度为 100 摄氏度,而我们是为 50 摄氏度。”

微软技术研究员兼公司副总裁 Marcus Fontoura 也对这种方法十分看好。他认为,向两相浸入式冷却转变可以提高灵活性,从而有效地管理云资源。例如,管理云资源的软件可以将数据中心计算需求中突发的峰值分配给液冷储罐中的服务器。因为这些服务器可以在较高的功率下运行(即超频),而没有过热的风险。



3


缓解水资源短缺


在提到这种方法的灵感启发时,微软明确指出是受到了近年来加密货币矿场使用这种液体冷却技术来辅助开采加密货币的影响。因而过去几年微软试用这种技术以应对未来更高强度的密集型工作负载。

除此之外,液体冷却技术的采用也与去年微软表示将解决水资源短缺的问题”的承诺有关:到 2030 年,其收集的水量要超过其全球运营所使用的水量。目前微软已经在其办公室使用雨水收集系统,并收集空调和工厂的冷凝水。

但由于微软的用水量不断增加,按计划达成目标变得愈发具有挑战性,此时两相浸入式冷却的推广使用会有很大帮助。

相较于普遍利用降低空气温度的沼泽冷却的耗水量,微软利用液体冷却的两相浸入式冷却技术极大程度地减少了用水量。微软 Azure 的首席软件工程师 Ioannis Manousakis 说:“如果采取正确措施,两相浸入式冷却将同时满足我们对成本、可靠性和性能的要求,而与空气冷却相比,其能源消耗几乎是零头。

其实,这种沉浸式工艺在行业中已出现了几年,不过微软声称它是“第一家在生产环境中运行两相浸入式冷却的云提供商。”但不论如何,微软对数据中心的散热可谓是十分上心,各种看似怪诞实则可行的方法都一一尝试,力争选出最合适的散热途径。

或许这次让服务器浸没在“浴缸”中的方法未来也会普及?对此你有什么看法吗,欢迎评论区留言!

参考链接:

https://news.microsoft.com/innovation-stories/datacenter-liquid-cooling/

https://www.theverge.com/2021/4/6/22369609/microsoft-server-cooling-liquid-immersion-cloud-racks-data-centers


end


👇👇👇留言的朋友均有机会获得书籍呦~
今日书单 | 包邮送

推荐理由:本书插图丰富,语言通俗易懂,适合初入机器学习领域的“萌新”,也适合希望将机器学习算法应用到日常工作中的其他专业从业者,还可供对人工智能领域感兴趣的读者参考阅读。

推荐理由:本书详细介绍了Raft的核心算法、服务器成员变更以及各种优化的实现,适合那些想尝试实现Raft算法或者在生产环境加入Raft算法的人,也适合那些对于Raft算法有兴趣的读者

推荐理由:本书内容精炼、重点突出、案例丰富,适合在企业中从事数据分析、数据挖掘、机器学习等工作的人员学习使用,同样适合想从事数据分析挖掘工作的各大中专院校的学生与教师,以及其他对数据分析挖掘技术领域有兴趣爱好的各类人员推荐理由:内容由浅入深,采用理论与实践相结合的方式讲解Java高并发编程的相关知识。全书分为基础、进阶、拓展和实战四大篇,体系化讲解Java高并发编程技术


活动规则:我们将从精选留言中随机抽取 8名 伙伴赠书,中奖者可在上方书单中任选一本图书,我们包邮赠送。书籍有限,中奖后先选先得。
  • 《机器学习与深度学习算法基础》 *2
  • 《分布式一致性算法开发实战》 *2
  • 《python数据分析全流程实操指南》 *2
  • 《Java高并发编程指南》 *2


留言要求:
  • 内容与本文核心信息相关 & 想要的书籍名称

  • 每人仅限精选一条留言(用心留言更容易上墙)

  • 为了大家都有机会中奖,每个小伙伴每个星期只能中一次奖哦~


截止时间: 2021 年 4 月 13 日 16:00 整兑奖时效:三天,收到留言请尽快联系圈儿。


每天 17:30 不见不散!




1、离开字节跳动的人(文末送书)

2、如何用敏捷搞垮一个团队?

3、沉入海底 2 年的微软数据中心浮出水面:故障率只有陆地上的 1/8,除了长点贝类和藻类完全没问题

4、阿里面试,拿到 P7 offer(这标题我怎么才能证明不是广告...)

识别关注我们

了解更多精彩内容

点分享

点点赞

点在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存